max rank | avg. rank | sentence |
---|---|---|
140 | 71.0909 | El año pasado no fue así durante gran parte del tiempo. |
230 | 67.0769 | No son todas las que están, pero si están todas las que son. |
239 | 117.9167 | “Lo importante es estar en la final, la forma es menos importante. |
293 | 112.6667 | El poder hoy lo tienen unos y mañana otros. |
311 | 96.7778 | ! por lo que a muchas personas les hace falta. |
315 | 65.6154 | El hombre no es más que lo que la educación hace de él.” |
317 | 96.8000 | En cualquier lugar del mundo, y no solo en España. |
337 | 107.0000 | Sin embargo, lo mejor de uno es cómo se es por dentro. |
338 | 131.0000 | Tegucigalpa, Honduras 20 de febrero de 2014. |
352 | 215.5000 | "Si ella puede, cualquier persona puede". |
361 | 130.0000 | El problema es que no tenemos otro mejor. |
369 | 80.1429 | En los dos últimos años, todo lo que hace está en el número uno. |
414 | 119.8182 | De esta vez a mi solo se me tuvo cinco días. |
418 | 172.2500 | Cuando se está bien Dios, todo es posible. |
441 | 172.1429 | Esta es una importante área de investigación. |
446 | 87.0833 | No solo en el fútbol sino en la vida, en el trabajo. |
454 | 153.4286 | Tegucigalpa, Honduras 3 de marzo de 2014. |
458 | 141.5000 | “El presidente está a nuestro lado”. |
458 | 100.2857 | Si uno se va para un lado, el otro se va para el otro. |
499 | 183.3750 | Es la sociedad misma, no es la institución. |
500 | 144.1000 | Hay mucho por hacer, pero calidad hay en el equipo. |
507 | 173.4286 | Desde el tiempo como experiencia de vida. |
511 | 88.0000 | No está de más, porque siempre que se quiere, se puede. |
511 | 179.9167 | Sin Dios, el hombre no puede; y sin hombre, Dios no quiere. |
515 | 119.5714 | Y lo mejor, es que tu relación con los dos puede ser muy buena. |
527 | 160.4000 | Si uno hace las cosas mal es para todos”, explicó. |
532 | 145.6667 | En la ciudad hay un total de 10 proyectos de este tipo. |
538 | 191.3333 | Una madre, una mujer que tiene algo de Dios. |
539 | 153.5000 | "Es un gran técnico, uno de los grandes. |
539 | 188.3750 | Honduras cuenta con el apoyo técnico de EE. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II